Enrichissement sémantique de documents XML représentant des tableaux

نویسندگان

  • Fatiha Saïs
  • Hélène Gagliardi
  • Ollivier Haemmerlé
  • Nathalie Pernelle
چکیده

Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiques. Cet article présente la transformation de ces tableaux, sous forme XML, en un formalisme enrichi sémantiquement dont la plupart des tags et des valeurs sont des termes construits à partir de l’ontologie. Mots-clés : extraction de connaissances, entrepôt, ontologie, XML, Web.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Enrichissement sémantique de méta-modèles XML et UML pour une transformation bidirectionnelle de modèles

RÉSUMÉ. XML est devenu depuis la fin des années 90 le standard pour échanger et envoyer de l’information sur Internet. Le W3C a ensuite préconisé l’utilisation de XML Schema pour définir la structure des documents XML. A ce jour, la modélisation graphique de modèles XML Schema n’est pas standardisée. L’introduction d’un formalisme de définition de modèles est un moyen de rendre la modélisation ...

متن کامل

Une approche pour l’extraction automatique de structures sémantiques de documents XML

RÉSUMÉ. La nature des sources d’informations et les possibilités de description des documents disponibles via ces sources sont en constante évolution. Cette évolution, et l’enrichissement des informations qui en découle, est accélérée par l’expansion du Web, et la mise à disposition de documents de type XML. Or la structure logique de ces documents XML, au travers de balises du genre Contenu, S...

متن کامل

Enrichissement d'ontologies grâce à l'annotation sémantique de pages web

Résumé. Nous présentons une approche pour enrichir automatiquement une ontologie à partir d’un ensemble de pages web structurées. Cette approche s’appuie sur un noyau d’ontologie initial. Son originalité est d’exploiter conjointement la structure des documents et des annotations sémantiques produites à l’aide du noyau d’ontologie pour identifier de nouveaux concepts et des spécialisations de re...

متن کامل

Structuration sémantique des documents XML : Expérimentations et évaluation

RÉSUMÉ. La norme XML permet la représentation d¶XQ document selon un découpage logique qui ne reflète généralement pas la sémantique de son contenu. Il serait donc intéressant de compléter la structure logique des documents XML par une structure VpPDQWLTXH /¶REMHW GH FHW DUWLFOH HVW DORUV G¶pYDOXHU O¶DSSURFKH G¶H[WUDFWLRQ GH VWUXFWXUHV sémantiques pour les documents XML que nous effectuons sur ...

متن کامل

F-CheX : Une approche de fouille dans les documents XML

Résumé. Nous présentons dans cet article une approche de fouille dans les documents XML qui prend en compte la structure et le contenu. Notre approche consiste à effectuer un clustering sur les documents XML. Ces derniers sont représentés par des ensembles de chemins conservant la structure arborescente des éléments. Les ensembles de chemins sont mappés dans une matrice sur laquelle une méthode...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005